Llama 4
Meta 2025 发布的开源大模型系列,是 Llama 3.x 的下一代,首次引入 MoE(Mixture of Experts)架构和原生多模态能力,对标 GPT-5 / Claude Opus 4 / Google Gemini 2.5 等闭源旗舰。
关键规格
| 版本 | 参数(激活/总) | 上下文 | 特性 |
|---|---|---|---|
| Llama 4 Scout | 17B / 109B(MoE) | 10M tokens | 长上下文专精 |
| Llama 4 Maverick | 17B / 400B(MoE) | 1M tokens | 综合旗舰 |
| Llama 4 Behemoth | 288B / 2T(MoE,训练中) | - | 教师模型 |
| 模态 | 原生多模态(文本+图像+视频) | ||
| 许可证 | Llama 4 社区许可(部分商业限制) |
市场定位
Llama 4 关键定位:
- 开源旗舰 —— 与闭源 GPT-5/Claude Opus 4 拉开开源生态护城河
- MoE 架构 —— 推理成本远低于 dense 模型(同 quality 下激活参数仅 17B)
- 超长上下文 —— Scout 版本 10M tokens 是业内最长之一
- 原生多模态 —— 与 Llama 3.x 后期"多模态版"分离架构不同,4 代统一训练
客户与部署
- 企业自部署:NVIDIA / AMD / Cerebras / Groq 等硬件适配
- 云服务:AWS Bedrock / Azure AI Foundry / Google Cloud Vertex AI / Databricks 第一时间上架
- 国内复刻 —— 国内多家公司基于 Llama 4 二次训练(受社区许可证商业限制)
演进路线
Llama 1(2023, dense)→ 2 → 3 → 3.1 → 3.2 → 3.3 → Llama 4 Scout / Maverick / Behemoth(2025, MoE+多模态)
关键来源
- 4-02-模型工厂 —— 大模型架构演进、开源 vs 闭源格局
关联
↑ up::Meta ↓ down::4-04-模型部署与优化 5-03-AIGC内容生成 5-04-AI编程助手 ⚔ competitor::GPT-5 Claude Opus 4 Google Gemini DeepSeek V3 Qwen3 Claude Sonnet 4 DeepSeek V4 Gemini 2.5 ∈ belongs_to::4-02-模型工厂